Bootstrapping (statistika)

Bootstrapping je v matematické statistice jakýkoli test nebo metrika, která používá náhodný výběr s vracením a spadá do širší třídy metod resamplingu, jež samy spadají mezi metody Monte Carlo. Bootstrapping se používá především pro odhad přesnosti (intervaly spolehlivosti, chyby predikce atd.) výběrových statistik.^[1]^[2] Tato technika umožňuje odhad distribuce téměř jakékoli výběrové statistiky pomocí metod náhodného výběru.^[3]

Bootstrapping odhaduje distribuci výběrové statistiky a/nebo její vlastnosti (například její rozptyl) mnohonásobným opakováním výběru s vracením z aproximujícího rozdělení. Běžnou standardní volbou pro aproximující rozdělení je empirická distribuční funkce pozorovaných dat. V případě, kdy lze předpokládat, že pozorování v souboru jsou nezávislá a stejně rozdělená, lze to provést vytvořením řady výběrů s vracením z pozorovaného souboru dat (o stejném rozsahu jako pozorovaný soubor dat) .

Bootstrapping lze také použít pro testování hypotéz. Často se používá jako alternativa ke statistickým odhadům a testům založeným na předpokladu parametrického modelu, když je tento předpoklad pochybný anebo pokud je parametrický závěr nemožný nebo vyžaduje složité vzorce pro výpočet standardních chyb.

Bootstrapping publikoval Bradley Efron v článku „Bootstrap methods: another look at the jackknife“ (1979),^[4]^[5] inspirovaným dřívějšími pracemi na metodě jackknife.^[6]^[7]^[8] Vylepšené odhady rozptylu byly vyvinuty později.^[9]^[10] Bayesovské rozšíření bylo publikováno v roce 1981.^[11] Booststrap korigovaný na vychýlení a zrychlený (bias-corrected and accelerated, BCa) publikoval Efron v roce 1987 a algoritmus ABC v roce 1992.^[12]

↑ EFRON, B.; TIBSHIRANI, R. An Introduction to the Bootstrap. Boca Raton, FL: Chapman & Hall/CRC, 1993. ISBN 0-412-04231-2.
↑ Second Thoughts on the Bootstrap – Bradley Efron, 2003
↑ Weisstein, Eric W. "Bootstrap Methods." From MathWorld--A Wolfram Web Resource. http://mathworld.wolfram.com/BootstrapMethods.html
↑ Notes for Earliest Known Uses of Some of the Words of Mathematics: Bootstrap (John Aldrich)
↑ Earliest Known Uses of Some of the Words of Mathematics (B) (Jeff Miller)
↑ Quenouille M (1949) Approximate tests of correlation in time-series. J Roy Statist Soc Ser B 11 68–84
↑ Tukey J (1958) Bias and confidence in not-quite large samples (abstract). Ann Math Statist 29 614
↑ Jaeckel L (1972) The infinitesimal jackknife. Memorandum MM72-1215-11, Bell Lab
↑ Bickel P, Freeman D (1981) Some asymptotic theory for the bootstrap. Ann Statist 9 1196–1217
↑ Singh K (1981) On the asymptotic accuracy of Efron’s bootstrap. Ann Statist 9 1187–1195
↑ Rubin D (1981). The Bayesian bootstrap. Ann Statist 9 130–134
↑ Diciccio T, Efron B (1992) More accurate confidence intervals in exponential families. Biometrika 79 231–245

[:0-1] EFRON, B.; TIBSHIRANI, R. An Introduction to the Bootstrap. Boca Raton, FL: Chapman & Hall/CRC, 1993. ISBN 0-412-04231-2.

[2] Second Thoughts on the Bootstrap – Bradley Efron, 2003

[3] Weisstein, Eric W. "Bootstrap Methods." From MathWorld--A Wolfram Web Resource. http://mathworld.wolfram.com/BootstrapMethods.html

[4] Notes for Earliest Known Uses of Some of the Words of Mathematics: Bootstrap (John Aldrich)

[5] Earliest Known Uses of Some of the Words of Mathematics (B) (Jeff Miller)

[Quenouille1949-6] Quenouille M (1949) Approximate tests of correlation in time-series. J Roy Statist Soc Ser B 11 68–84

[Tukey1958-7] Tukey J (1958) Bias and confidence in not-quite large samples (abstract). Ann Math Statist 29 614

[Jaeckel1972-8] Jaeckel L (1972) The infinitesimal jackknife. Memorandum MM72-1215-11, Bell Lab

[Bickel1981-9] Bickel P, Freeman D (1981) Some asymptotic theory for the bootstrap. Ann Statist 9 1196–1217

[Singh1981-10] Singh K (1981) On the asymptotic accuracy of Efron’s bootstrap. Ann Statist 9 1187–1195

[Rubin1981-11] Rubin D (1981). The Bayesian bootstrap. Ann Statist 9 130–134

[Diciccio1992-12] Diciccio T, Efron B (1992) More accurate confidence intervals in exponential families. Biometrika 79 231–245

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Bootstrapping (statistika)

From Wikipedia, the free encyclopedia · View on Wikipedia